Stable Diffusion 是什么?
Stable Diffusion 是由 Stability AI 公司于 2022 年 8 月 22 日正式发布的开源文本到图像生成 AI 模型。Stability AI 由 Emad Mostaque 创立,获得 Coatue Management 和 Lightspeed Venture Partners 等机构 1 亿美元投资,估值达 10 亿美元。Stable Diffusion 采用潜在扩散(latent diffusion)架构,是全球最流行的开源 AI 绘画模型,累计下载量超过 1000 万次,拥有最丰富的社区生态。
核心功能
输入自然语言描述生成高质量图像,支持风格修饰符、艺术家参考等高级提示词
上传参考图片进行风格迁移、草图转图像、图像变体生成
选择性重绘图像特定区域,用于编辑、物体移除、细节增强
使用边缘检测、姿态估计、深度图等条件精确控制生成结果
Stable Diffusion 持续迭代,从 SD 1.5 到 SDXL 再到 SD3/SD3.5,分辨率从 512×512 提升至 1024×1024 以上,引入 Transformer 架构,大幅改进提示词理解和文字渲染能力。平台拥有数千个社区创建的 LoRA 模型、Embedding 和 Checkpoint,可通过 Automatic1111 WebUI、ComfyUI 等工具本地部署,完全离线运行。
开源免费 · 本地部署
模型权重采用 CreativeML Open RAIL-M 许可证,个人和商业使用均免费,无需订阅费。本地部署最低要求 4GB VRAM,推荐 8GB+ VRAM 显卡。
产品信息
Stability AI (Emad Mostaque)
1000 万 + 次下载
开源免费 · 本地部署
GPU 4GB+ VRAM
适用场景
概念艺术、插画创作、游戏资产设计
模型微调、应用开发、扩散架构实验
营销素材、产品 mockup、社交媒体配图
YouTube 缩略图、直播背景、博客配图
图像工具的其他工具